iT邦幫忙

2023 iThome 鐵人賽

DAY 14
0
AI & Data

電腦眼中的人臉--論近代人類都用電腦視覺技術在人臉上做了什麼系列 第 14

[第十四夜] 人臉關鍵點偵測 : Heatmap-based 模型結合 Direct方法的改進--PIPNet 介紹

  • 分享至 

  • xImage
  •  

前言

HI 各位,歡迎繼續回來我們這個系列,今天我們要介紹一下 Heatmap-based結合 Direct 方法去做執行速度等等效能上的改善,主要介紹 PIPNet 這一篇論文的技術細節!

PIPNet

PIPNet 來自於 Inception Institute of Artificial Intelligence (IIAI), Abu Dhabi, UAE 的研究員發在 IJCV 2021 上的論文 "Pixel-in-pixel net: Towards efficient facial landmark detection in the wild"
他主要的想法為,讓 Heatmap 中的 Upsample 這一步不要做,改成去預測 score 跟 offset:
https://ithelp.ithome.com.tw/upload/images/20230929/20120549uhuhP7fU3M.png
而這兩個 branch 的功用如下:

1.Score branch

  * Coarse-Grained predict 粗粒度預測
  * 預測目標點出現在 heatmap 的哪一個位置

2.Offset branch

  * Fine-Grained predict 細粒度預測
  * 預測 x y 座標與左上角的距離

具體預測出來如下:
https://ithelp.ithome.com.tw/upload/images/20230929/20120549Kw75GqEtbr.png
上圖中女生的眼睛上有一個紅點標記的關鍵點,我們的 score 就希望預測出 1.0,而接下來的的 offset 就希望可以分別預測出這個 patch 上的關鍵點距離 x,y (分別是 0.3 & 0.8)

Neighbor Regression Module (NRM)

而這個 PIPNet 的作者還發現了一見有趣的是可以幫助模型更加 robust,就是當下這個關鍵的 heatmap 如果也能夠預測出相近點的 offset 那拜表這個模型更加理解整體關鍵點之間的關係,進而達到更好的預測果。這個模組被取名為 Neighbor Regression Module (NRM),預測如下圖:
https://ithelp.ithome.com.tw/upload/images/20230929/20120549lR1zNXARJI.png
所以總體而言,PIPNet 結合 NRM 的話模型結構如下:
https://ithelp.ithome.com.tw/upload/images/20230929/20120549YyICP9ZTIO.png
預測出來如下:
https://ithelp.ithome.com.tw/upload/images/20230929/20120549bFYwNurZcg.png
但聽起來是有道理,那我們臉上有那麼多關鍵點(98個點不是?) 那可不可以直接每個關鍵的 Heatmap 都去預測出其他的關鍵點呢?作者到是有做過實驗驗證不是越多越好:
https://ithelp.ithome.com.tw/upload/images/20230930/20120549ppUKSTLYRB.png
上圖這個實驗為PIPNet 跟預測不同數量鄰近點的 PIPNet w/ NRM 做比較,縱軸是之前介紹的 NME 評量分數(越低代表越準)我們可以得知以下兩個事實:

  1. 有做 NRM 無論預測幾個相鄰點都是比沒有 NRM 好的!
  2. NRM 不是預測越多鄰近點越好,大約是附近10~15點最好!

效果

我們用一張圖來表達 Direct, Heatmap-based 以及 PIPNet 之間準度問題:
https://ithelp.ithome.com.tw/upload/images/20230929/20120549kBffYHXeyT.png
我們可以輕易看出 PIPNet 效果好了非常多,而 Heatmap-based 確實比 Direct 好!
而我們也比較一下 PIPNet w/ NRMPIPNet w/o NRM:
https://ithelp.ithome.com.tw/upload/images/20230930/20120549hYgmAkHT4l.png
而速度跟精度的 trade-off上,如下圖,我們可以看到 PIPNet 在當時表現出了可以媲美 Heatmap-based 的準度又同時有著極快的運行速度!
https://ithelp.ithome.com.tw/upload/images/20230930/20120549YGaMmRTSjE.png

結語:

我們今天提及了 Heatmap-based 結合 Direct 的改善模型--PIPNet,明天我們將介紹相關模型的實做!!

Ref.

1.H Jin, S Liao, L Shao. Pixel-in-pixel net: Towards efficient facial landmark detection in the wild. arXiv preprint arXiv:2003.03771, 2020


上一篇
[第十三夜] 人臉關鍵點偵測 : Heatmap-based 模型--Hourglass 結構介紹
下一篇
[第十五夜] 人臉關鍵點偵測 : Heatmap-based 模型以及PIPNet 實作
系列文
電腦眼中的人臉--論近代人類都用電腦視覺技術在人臉上做了什麼30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言